人工智能中的token是什么意思

时间:2026-06-04 栏目:AI

在人工智能领域,Token(词元)是处理文本的最小数据单元,是AI处理文字、图片、语音时最小的计算单位,相当于AI的基础语言单位。

Token可以是单词、子词、字符、标点符号等,具体取决于所使用的分词算法和上下文环境。例如,英文句子"I love learning.“可能被拆分为"I”、“love”、"learning"三个Token;中文句子"我喜欢学习。“可能被拆分为"我”、“喜欢”、"学习"三个Token。在处理文本之前,需要先将文本进行tokenization(分词),将文本转换为tokens,模型实际处理的是这些tokens而非原始文本。

Token在人工智能中的应用非常广泛,它不仅是计量单位、计价单位,还是计算的基本单位。Token数量影响模型的性能、结果质量以及使用成本。例如,一些API或服务按使用的token数量计费(输入+输出的总token数量)。此外,Token数量还决定了AI能记住多少内容、使用AI的花费以及AI的速度和效果。现在,AI还会把图片、语音切成视觉词元、音频词元,实现看图、听声。

Token的消耗量增长与人工智能应用落地强绑定,成为衡量人工智能产业景气度的重要晴雨表。例如,2024年初中国日均Token的消耗量为1千亿,截至2025年9月底,这一数字已突破40万亿,1年多时间增长了400多倍2。截至2026年3月,中国日均Token(词元)调用量超过140万亿,相比2024年初的1000亿增长了1000多倍


在人工智能领域,Token(词元)是处理文本的最小数据单元,是AI处理文字、图片、语音时最小的计算单位,相当于AI的基础语言单位。

Token可以是单词、子词、字符、标点符号等,具体取决于所使用的分词算法和上下文环境。例如,英文句子"I love learning.“可能被拆分为"I”、“love”、"learning"三个Token;中文句子"我喜欢学习。“可能被拆分为"我”、“喜欢”、"学习"三个Token。在处理文本之前,需要先将文本进行tokenization(分词),将文本转换为tokens,模型实际处理的是这些tokens而非原始文本458。

Token在人工智能中的应用非常广泛,它不仅是计量单位、计价单位,还是计算的基本单位。Token数量影响模型的性能、结果质量以及使用成本。例如,一些API或服务按使用的token数量计费(输入+输出的总token数量)。此外,Token数量还决定了AI能记住多少内容、使用AI的花费以及AI的速度和效果。现在,AI还会把图片、语音切成视觉词元、音频词元,实现看图、听声23。

Token的消耗量增长与人工智能应用落地强绑定,成为衡量人工智能产业景气度的重要晴雨表。例如,2024年初中国日均Token的消耗量为1千亿,截至2025年9月底,这一数字已突破40万亿,1年多时间增长了400多倍2。截至2026年3月,中国日均Token(词元)调用量超过140万亿,相比2024年初的1000亿增长了1000多倍



相关文章: